package spark_core.operate_transform.singlevalue;

import java.util.Arrays;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;

/**
 * @author shihb
 * @date 2020/1/7 11:43
 */
public class SampleDemo {

  public static void main(String[] args) {
    //local模式,创建SparkConf对象设定spark的部署环境
    SparkConf sparkConf = new SparkConf().setMaster("local[*]").setAppName("mark rdd");
    //创建spark上下文对象（这边是java上下文）
    JavaSparkContext sc = new JavaSparkContext(sparkConf);

    JavaRDD<Integer> arrayRdd = sc.parallelize(Arrays.asList(1, 2, 3, 4,5,6,7));
    //生成数据，进行抽样,可以有三个参数（是否放回,分数0抽不出来1一定能抽出来,随机数种子）
    JavaRDD<Integer> sampleRdd = arrayRdd.sample(false, 0.4, 1);

    sampleRdd.collect().forEach(System.out::println);

    //停止
    sc.stop();

  }
}
